#Manus AI
Manus AI 上線以來最大更新:100 個 Agent 為你打工,但缺點是太燒錢了
一個 Agent(智能體)不夠用?Manus 乾脆給你拉來 100 個。今天凌晨,Manus 推出了一項新功能:Manus Wide Research。這項功能的核心亮點在於,使用者只需一鍵即可開啟大規模平行 Agent 協作,輕鬆處理原本需要耗費數小時、動用數百個資料來源的複雜調研任務。簡單來說,這類似於此前 Grok 4 Heavy 的多 Agent 模式——同時啟動多個 Agent 平行工作,最後整合輸出結果。不過,Manus Wide Research 的調度規模更為龐大,Agent 之間的協作也更加緊密。在官方的演示 demo 中,Mamus 展示了兩個典型的案例。第一個案例,是讓 Wide Research 對比分析 100 款運動鞋。從功能、定價、設計到銷量,Manus 會首先並行呼叫 100 個子 Agent ,每個負責一款產品,獨立抓取分析、彙總資訊。隨後,這批結果被自動彙總成 Excel 表格和網頁,交付清晰的最終排序和評估建議。第二個案例,是為即將舉辦的活動尋找海報靈感。Wide Research 能夠同時探索 50 種視覺風格,並自動生成匹配風格的完整海報圖樣。幾分鐘內,成品設計就能交到使用者手上。目前,這項新功能已率先向 Pro 使用者(199 美元/月)開放,並計畫逐步向 Plus(39 美元/月)和 Basic(19 美元/月)層級使用者開放。值得一提的是,系統會根據任務需求自動啟動 Wide Research,無需使用者手動設定或切換。X 網友 @LamarDealMaker 在體驗後發文稱:「manus wide research 是我最近用過的最好的工具之一。50 個 Agent 同時在網際網路上搜尋,收集 AI 新聞資料並填寫這張表格,現在我擁有了一個按需呼叫的個人 AI 蜂群,很興奮將其應用到我的日常工作流程中。」當然,Manus 的積分機制早就被吐槽「貴得離譜」,如今新功能大幅升級,積分的消耗速度勢必進一步飆升。Manus 聯合創始人肖宏也疑似在社交媒體上回應這個問題:AI 在開始時更像邊際成本很高的原子生意,然後(也許會)逐步轉變成為邊際成本更低或者接近於零的位元生意。和這個匹配的做法是1.製造超貴但是拓展人類能力邊界的 AI 產品。2.用 1 掙到的錢造價格實惠的 AI 產品。3.再用 2 掙到的錢造價格更實惠的 AI 產品。現在在階段 1,也才剛剛開始。下一個發佈,再來 100x Token 消耗量。就目前來看, Wide Research 的底層邏輯遠不止「多開 Agent」那麼簡單。其背後其實是一個系統級的平行計算機制——每個 Manus 會話都運行在一台獨立虛擬機器上,具備編排複雜雲工作負載的能力。而 Wide Research 把這套資源能力擴展到了百倍規模,試圖讓一個人調度一個 AI 雲端運算叢集。更重要的是,與傳統多 Agent 系統通過角色預設(比如設計師、程式設計師、分析師)進行分工不同,Wide Research 中的每個子 Agent 都是一個完整的 Manus 實例,能自主思考、自我執行,再集中交付任務結果。Manus 聯合創始人季逸超也在 X 平台發文,進一步解釋了這一架構的靈感來源:Wide Research 是我們在 Agent-Agent 協作方面的最新探索。基於我們的大規模虛擬化基礎設施,Manus 現在可以自主調度一支由同質 Manus Agent 組成的團隊平行工作,並彙總結果。在建構 AI Agent 的過程中,我們一直受到經典系統研究的啟發。Wide Research 直接受到了 20 多年前由 @JeffDean 和 Sanjay Ghemawat 提出的 MapReduce 範式的啟發。作為大規模分佈式系統的先驅,Google遇到了其他人尚未面臨的挑戰,並慷慨地與世界分享了他們的解決方案。如今,隨著 Manus 推動 AI Agent 的邊界,我們正遇到一類只有在大規模時才會出現的新問題。我們將繼續分享在此過程中學到的經驗。特別需要指出的是,儘管願景很宏大,Manus 並未提供足夠證據證明這種同時啟動數十甚至上百個子 Agent 的方案,是否真的比單個高容量 Agent 按順序完成任務更高效。子 Agent 如何分工、如何合併結果、在響應速度、精準率和成本上是否具備顯著優勢,官方尚未提供相關依據。 (APPSO)
一文讀懂ChatGPT Agent:沒超越Manus的能力範疇,但看到了端到端的曙光
Agent是今年AI圈最大的共識,OpenAI自然也無法落後。台北時間2025年7月18日凌晨1點,Sam Altman和四位OpenAI 的研究員在直播中正式發布了ChatGPT Agent——一款通用型AIAgent。前有Manus、Lovart和Flowith,ChatGPT Agent所呈現的功能場景並不算特別驚艷,但它發布的意義,要超越其功能本身。ChatGPT Agent的革命性在於其獨特的技術路徑:它可以主動從工具箱中選擇代理技能,使用自己的電腦完成任務,使用者可以即時觀察AI在虛擬環境中的工作過程。這種交互界面雖與Manus等產品相似,但底層原理卻有著本質差異。Manus調用多個底層模型,類似於“外部縫合”,而ChatGPT Agent,是將Agent能力內化於模型,我們已經看到了端對端通用Agent的雛形。Manus的設計實質上是透過調用多個底層模型來實現"外部縫合"。相較之下,ChatGPT Agent是將Agent能力內化於模型本身。根據OpenAI介紹,為了開發ChatGPT Agent,他們將Operator和Deep Research團隊合併為一個統一的團隊,這個新團隊由20至35人組成。根據ChatGPT Agent的系統卡顯示,它是一個新的代理模型,與OpenAI o3同屬一個系列,採用了端到端的訓練方法。它是為代理任務開發的統一模型,而不是多個模型的工程化組合。根據OpenAI放出的對比PPT,我們可以看到,這項訓練基本上是透過強化學習過程完成的。和Grok4withtool的路徑應該差不多。經過再訓練,Agent結合了Deep research的多步驟研究和高品質報告產生能力、Operator透過遠端視覺化瀏覽器環境執行任務的能力、具有有限網路存取權限的終端工具,以及透過連接器存取外部資料來源和應用程式的能力。在執行完複雜任務之後,也可以交付給使用者一個可下載的一個PPT或一份文件。對Manus而言,OpenAI的這項新舉措無疑是巨大的打擊,甚至從定價上,兩者也差距不大:GPT的Plus套餐每月20美金即可使用ChatGPT Agent,而Manus的基礎計劃是每月19美金。底線重點:ChatGPT Agent:是能夠執行複雜、多工具任務的統一AI Agent。它整合了對文字瀏覽器、GUI 瀏覽器、終端和圖像生成工具的存取。支援與用戶進行互動式、多輪對話,允許打斷和澄清。安全防護升級:加強對網頁「惡意提示」攻擊的防禦;設定高風險任務自動拒絕;生物/化學風險也按最高等級安全堆疊處理。它在多個現實世界和基準任務中取得了最先進的結果。ChatGPT Agent概覽功能很像ManusChatGPT Agent的核心是一個統一的代理系統(unified agentic system),整合並擴展了OpenAI 早期研究專案"Operator"(專注於網站互動)和"Deep Research"(專注於資訊綜合)的能力。這使得ChatGPT Agent 能夠在單一的對話流中,無縫地從推理思考切換到執行具體動作。虛擬電腦環境:ChatGPT Agent在一個為其特設的虛擬電腦上執行所有任務。這個環境是沙盒化的,確保了操作的安全性。它能夠在該環境中保存任務的上下文,即使用戶中途打斷或改變指令,也能從斷點繼續,而不會丟失進度。智慧工具箱:為了完成複雜工作流程,Agent 配備了四種工具,並能根據任務需求自動選擇最適合的工具:視覺化瀏覽器(Visual Browser): 用於與圖形使用者介面進行交互,例如點擊按鈕、填寫表單和瀏覽為人類設計的網站。文字瀏覽器(Text-based Browser): 用於需要高效推理和處理大量文字的網路查詢。終端機(Terminal): 允許Agent 運行程式碼、下載和處理文件。API 存取: 可以直接呼叫API 來獲取訊息,例如透過連接器存取Google Drive、Gmail 和GitHub 等應用程式的資料。新模型驅動:ChatGPTAgent由一個專門為其開發的新模型驅動。這個模型透過強化學習(reinforcement learning) 的方法,在需要使用多種工具的複雜任務上進行了專門訓練,從而學會瞭如何在不同工具之間流暢切換並協同工作。它有以下特性:自主任務執行: 使用者可以用自然語言下達指令,例如“分析我的日曆,並根據最近的新聞為我簡報即將到來的客戶會議”,Agent 能夠自主規劃並執行系列操作,如瀏覽網站、篩選資訊、運行程式碼分析,並最終產生可編輯的幻燈片或電子表格等成果。協作與互動性:它會在需要時主動詢問更多細節以完成目標。使用者可以隨時中斷、重定向任務或完全接管瀏覽器的控制權。安全性與權限控制: 安全性是其設計的核心部分。在執行購買、提交表單、發送郵件或處理個人資訊等具有實際影響的關鍵操作之前,Agent 會明確請求使用者許可。同時,它被禁止執行如金融轉帳或提供法律建議等高風險任務。 OpenAI 也內建了針對「提示注入」等惡意攻擊的防護措施。多項基準測試跑分“破紀錄”最難的HLE 達到41.6%(with tool), 高於剛發表的Grok4(with tool)41.0%。在測量廣域知識與專家級提問的Humanity's Last Exam 上,單次作答準確率達41.6%;採用並行八路推理並選取置信度最高答案後可提升到44.4%。在極難的FrontierMath 數學基準上,借助終端運行程式碼後準確率提升至27.4%。在針對真實知識工作任務的內部評測中,ChatGPT 代理人在約半數案例裡已與人類持平或更佳;在現實資料科學任務DSBench 上,其分析與建模準確率分別達到89.9% 與85.5%,遠超過人類平均值。它對電子表格的直接編輯能力也領先:在SpreadsheetBench 中拿到45.5%,超過 Copilot in Excel 的20%。此外,它在BrowseComp、WebArena 等瀏覽評測裡均刷新了SOTA。(圖:評測方法:SpreadsheetBench的作者在Windows 環境下使用Microsoft Excel 對電子表格進行評估。我們則在OSX 環境中使用LibreOffice,這可能導致評分出現輕微差異。例如,作者報告GPT‑4o 在整體Hard 限制上的結果為15.02%,而我們得到13.38% 在整體Hard 限制上的結果為15.02%,而我們得到了13.912題目根據ChatGPT Agent自己做的PPT,在做PPT的能力上和上網衝浪能力上,Agent的能力都相比純粹的基礎模型有較明顯的提升。但離人類還頗有距離。不是期貨,今日可用自今日起,Pro 用戶可以馬上使用,Plus 與Team 用戶將在數日內陸續開通;Enterprise 與Education 版本將於數周後接入。Pro 每月可用400 則訊息,其他付費用戶每月額度為40 條,可透過彈性的按量計費追加。實際使用非常簡單:在任何對話中切到「代理模式”,描述目標,例如深入研究、製作演示或報銷。螢幕左側即時顯示它的操作流程;若需要登錄,系統會切換到「接管模式」安全輸入憑證。使用者也可以把完成的任務設為周期性執行,例如每周一自動產生指標報告。奧特曼親自提示風險:Agent很強大,也很危險值得注意的是,奧特曼在發布會之後,立刻發了一條長貼,提示使用ChatGPT Agent的風險。在「強調」過ChatGPT Agent處理複雜任務的強大能力後,特別鄭重地提示了產品的風險,並強調:我們尚不清楚具體會造成什麼影響,但不法分子可能會試圖「誘騙」用戶的AI 代理提供不該提供的私人資訊並採取不該採取的行動,而這其中的方式我們無法預測。模型可能會接觸使用者的敏感數據,或遭遇網頁中的惡意「提示注入」攻擊。為此,他們沿用Operator 期間的嚴格控制,並新增多項防護:關鍵動作前必須先得到使用者明確授權;部分高風險任務(如發送郵件)啟用「監督模式」要求使用者全程監控;碰到銀行轉帳等高風險指令會主動拒絕;使用者可一鍵清除瀏覽資料並登出全部會話,或在不需連網時停用連接器。在生物與化學安全方面,OpenAI根據Preparedness Framework 將該模型按高風險級別處理,上線了最全面的安全措施,並與政府、學界及安全機構合作開展紅隊測試與威脅建模,同時啟動漏洞賞金計劃,以便儘早發現並修補潛在問題。ChatGPT Agent夠遙遙領先嗎?ChatGPT Agent最大的創新在於首次在模型中直接整合了完整的虛擬機器環境,使用者可以即時觀察AI的操作過程,這是其它模型產品不具備的。但是,各主流模型公司都在「Agent即模型,模型即Agent」的路上越走越遠。例如,在coding agent能力上幾乎封神的Claude。眾多需要藉用底層模型搭建的Agent產品,甚至離開了Claude,就什麼也不是。剛上線的Kimi K2採用開源的混合專家模型架構,定位就為Agentic Intelligence,且價格僅有Claude 4的1/6左右。上線之後,token的採用量排名持續飆升。但從「模型即Agent」這條路來說,OpenAI並不能算是遙遙領先,僅僅能說邁出了一小步。OpenAI在官方文件中也特別謙虛地表示:需要注意的是,功能仍處早期:例如投影片產生功能現為beta,格式與美觀度仍待提升,現階段主要優化資訊結構與元素可編輯性;未來我們將繼續訓練新版本,以產生更精緻的文件。總的來說,隨著持續迭代,ChatGPT 代理的效率、深度和多樣性都會不斷提升,我們也會逐步調優用戶監督的力度,在易用與安全之間取得更好平衡。看著自家產品的展示,Sam Altman不禁又開始感嘆,「我感受到了AGI」。然而,在貼文後面還是有用戶留言問,說好的GPT-5呢?(騰訊科技)
Manus跑路了嗎?
Manus,真的從中國撤了?!4個月前一夜躥紅起飛的AI Agent產品Manus,剛被曝出背後公司一舉裁掉中國七成團隊。事實上,Manus總部已在5月搬到了新加坡,中國員工何去何從?現在答案終於落定,一言以蔽之:大刀闊斧地裁員。Manus中國團隊約120人,僅有核心研發團隊40人遷往新加坡,其餘約80名非核心員工被裁。據稱裁員補償待遇優厚,被裁人員能拿到N+3或2N的賠償。事實上,Manus的離開似乎十分絲滑和平靜。現在再來到Manus北京辦公室曾經所在地epark海淀花園路社區,園區人員並不知道這家公司撤離的具體時間,園區也不同於3月爆火時媒體往來與駐紮,一片喧囂模樣。當量子位問及相關事宜時,聯合創始人兼CEO肖弘以他昨日午後在即刻的一篇帖子作為回覆。其中寫道:想要在全球化的市場裡做好產品,有很多不是來自業務本身和使用者價值本身的煩惱。但這一切是值得的。一方面因為旅程本身就有很多開心的、讓自己和團隊成長的事情。另外一方面,如果最後有不錯的結果,證明作為中國出生的創始人,也能在新的環境下做好全球化的產品,那就太好了!Manus一夜躥紅後這125天,也真沒少幹活就大規模裁員傳聞,Manus官方對外給出的回覆是,“基於公司自身經營效率考量”,因此“決定對部分業務團隊進行調整”。不少人將這一回應解讀為Manus在華潰敗,以至於消息傳出後很多人表示疑惑,第一反應是:這麼快?不是還火得一塌糊塗嗎?是的,Manus火得一塌糊塗,而且從發佈起一直火到今天——天價邀請碼給予了大眾對這家公司最深刻的記憶烙印,以至於其它新聞關注者寥寥。其實梳理後不難發現,發佈至今的125天以來,Manus都持續在對外釋放好消息。3月,關鍵詞:一炮而紅3月6日凌晨,Manus突然上線,名稱取自拉丁語 “Mens et Manus”,意為大腦+雙手。它的定義為全球首款通用AI Agent產品,強調其獨立思考+任務執行能力。發佈3日內,等待名單突破200萬,官網因流量過大當機;發佈當周即超越OpenAI的DeepResearch等,登上GAIA基準測試榜首。由於採用邀請制內測,一碼難求,市場一度哄抬到10萬元/碼。部分內測人士開始發佈實測反饋,“套殼”“無護城河”等輿論開始發酵。3月10日,Manus聯合創始人兼首席科學家季逸超直接表示產品“基於阿里千問大模型及Claude等模型微調而成”,並強調這是自主整合框架,不懼“套殼”爭議。同日,也就是產品發佈後第五天,Manus官方宣佈與阿里通義千問團隊達成合作。一是宣佈計畫基於通義開源模型實現國產化替代。同時宣佈的還有接入QwQ-32B模型降低推理成本。當時,內測使用者日均呼叫成本已經來到2美元水平線。此後,Manus官網逐漸完全漢化。3月18日,聯合創始人兼首席科學家季逸超發推文透露,Manus這樣的Agent環境下,每個使用者的平均token消耗量是聊天機器人的1500倍,“這僅僅是個開始”。3月28日起,Manus開始推出付費訂閱計畫,Starter檔39美元/月,Pro檔199美元/月。3月底,Manus在舊金山舉辦了第一次線下使用者聚會。4月,關鍵詞:B輪融資整個4月上旬,Manus顯得比較沉默,但朋友圈裡可以看到創始團隊全球飛來飛去參加各種活動、論壇與交流會的身影。不過到4月下旬就有好幾個比較重磅的新消息傳出。一個是4月16日,Manus整合到了Google Drive,使用者點選上傳檔案按鈕,就能連接Google Drive開始使用。另一個是傳出了融資進展。彭博社稱Manus完成7500萬美元(約合人民幣5.5億元)B輪融資。領投的Benchmark是一家美國老牌VC,以少而精、長期陪跑著稱,曾投資過eBay、Twitter、Instagram、Uber、Snapchat,2024年募資後重點投向AI領域。此時,Manus估值已經較上一輪融資時翻了5倍,來到5億美元(約合人民幣36.5億元)。而此輪資金的主要流向之一,就是“主要用於擴張美國、日本、中東等海外市場”。5月,關鍵詞:開放註冊5月12日,翹首以盼的等待者們終於迎來了Manus向所有使用者開放。所有新使用者獲1000積分獎勵,此後每日免費贈送300積分。開放首日,Manus註冊量即破100萬。5月14日,市場出現該公司估值飆升至15億美元的傳聞,很快遭合夥人張濤否認。5月15日,關聯公司北京紅色蝴蝶科技有限公司發生工商變更,Manus聯合創始人兼CEO肖弘新任該公司法定代表人、經理、董事職務,同時該公司增資至2000萬美元。5月16日,Manus趁熱打鐵上線圖像生成功能。這是一個綜合性AI Agent圖像生成功能。不僅能生成圖像,還能理解使用者意圖,規劃解決方案,並知道如何有效利用圖像生成工具及其他工具來完成任務。緊接著,5月21日,Manus宣佈了與微軟的合作。與微軟/Azure AI Foundry之間協同,以期推動快速擴展並解鎖新的企業應用場景。6月,關鍵詞:總部遷徙6月4日,Manus針對付費使用者開放了原生AI視訊生成服務,強調輸出有故事性的視訊內容,單次生成片段約為5秒。6月8日,官推宣佈上線PPT功能。直到這個時候,一切看上去還是有條不紊,風平浪靜,其實暗流早已湧動——6月13日發佈的官網博文顯示,Manus在新加坡招聘AI工程師、資料科學家、軟體開發經理等崗位,月薪8000美元起步。同時,加州、東京也設有辦公室。6月18日舉辦的新加坡Super AI活動上,產品合夥人張濤表示:公司總部已經遷至新加坡。6月26日,Manus官網發表文章,披露:在過去三個月中,Manus通過架構增強和基礎設施最佳化,將速度提高了2倍,成本降低了5倍。7月,關鍵詞:中國裁員7月8日,網路平台傳出消息,稱Manus將裁掉中國約80位員工,佔中國員工總數七成左右。針對此消息,Manus方面回應澎湃新聞稱:基於公司自身經營效率考量,我們決定對部分業務團隊進行調整。公司將繼續專注核心業務發展,提升整體營運效率。看起來真走了,但說實話也不意外Manus真的走了嗎?先是張濤公眾場合公開表示總部已搬遷,後是裁員消息得到官方證實。雖然官方並沒有正式發佈任何“總部遷移”公告,但從各種訊號來看,Manus已經悄然完成了轉場。不過目前的工商資料顯示,截至推文發出,Manus背後的北京蝴蝶效應科技有限公司(後簡稱蝴蝶效應)、北京蝴蝶效應科技有限公司武漢分公司還處於存續狀態。但是日曆往前翻,Manus母公司蝴蝶效應在新加坡的實體Butterfly Effect Pte. Ltd.,早在Manus產品上線之前——2023年8月就完成註冊,並由開曼群島註冊的母公司全資控股。簡單概括結構:開曼控股公司→新加坡實體Butterfly Effect Pte. Ltd.→Manus產品團隊。這是一套典型的出海架構,用於便利海外融資、營運和拓展海外市場。所以Manus從一開始,就心放全球了。但中國市場該產品依舊線上,訂閱服務仍可購買,使用者並未被斷供。只不過約等於Manus終於明目張膽地表示,今後的資源和主力轉向了海外,這是一種典型的重心轉移。普通人或許沒有探究其背後各種公司註冊的運作,但一定能從最初的產品發佈視訊中發現線索。這家公司針對Manus推出的首個宣傳視訊,這個後來被無數Agent產品發佈時競相效仿的宣傳視訊,從頭到尾都在用英文介紹這款橫空出世的產品。說白了,Manus爆火4個月後的核心力量大遷徙,主攻海外,早就在與公眾見面的第一天就埋下了草蛇灰線。所以才說這種選擇毫不意外。一方面,Manus做的是通用AI Agent,驗證了標準化工具整合的可行性,這種與MCP類似理念的生態在海外更成熟。不論是模型的API可接入性,還是開發者生態、企業客戶付費意願,都更適合他們當前的產品形態。另一方面,中國使用者對ToC軟體的付費習慣依然較弱。那怕是AI應用,大部分仍傾向於“體驗為主”,使用者粘度不高。量子位智庫統計資料顯示,剛剛過去的6月,DeepSeek在Web端的中國總訪問量市場總佔比也持續下降至39%。名聲最盛且免費使用的DeepSeek尚且遭遇這樣的斷崖式使用者流失,更別提任何一個訂閱制的AI產品了。中國當下的環境,想要維護高粘性使用者群體,建立穩定訂閱,真的並不容易。更何況你也看到了,Manus一開始的野心就是全球市場,應該也從未有一刻想過放棄。選擇從一個更利於融資、開發、落地的地方出發,是現實驅動下的策略選擇。就像合夥人張濤昨日在即刻的發言:選擇正確的激勵函數,比函數值本身更為重要究其本質,Manus和所有做出海業務的公司沒什麼兩樣。只是這家由中國團隊攢局,並在全球打出一片天的AI Agent公司,在破圈式爆火125天後,間接宣判了自己的下一步:業務重心、核心人員和公司總部,從今以後一起“物理”出海去了。說白了,Manus現在優先賺外國人的錢,做給海外使用者用的工具,算不上潰敗,也不是跑路,更多是一種選擇。不過話說回來了,面向出海後就不捲了嗎?矽谷那邊最新的風投消息是,Agent創業賽道里,擠滿了中國人……哈哈哈哈。 (量子位)
字節、百度湧入8500億藍海,Manus式的創業機會還有嗎?
「奔向AGI」欄目聚焦AI大模型、AI agent、AI應用、晶片、機器人等前沿、熱門的AI技術和商業創新。近期,OpenAI創始人山姆·阿爾特曼表示,2025年將是AI Agent大規模應用之年。“Agent作為‘數字員工’,將為各行業顯著節省時間,提升效率,創造可觀的商業價值。”他說。簡單而言,AI Agent可替人執行查資料、訂機票、做PPT、寫程式碼等任務,是能自主思考,替人幹活的“數字管家”。今年,OpenAI一口氣推出兩款AI Agent產品:Operator可自主操作瀏覽器完成複雜任務,例如線上訂餐、購物和訂票;Deep Research能在半小時之內輸出金融、科學、政策等領域的深度調研報告。它還花30億美元收購了程式設計AI Agent公司Windsurf。AI Agent也在中國火熱。Manus內測碼曾被黃牛炒至上千元,而後它又獲得矽谷VC領投的7500萬美元投資。字節跳動、阿里巴巴等網際網路大廠紛紛下場,Flowith、Lovart等AI Agent創業項目也紛紛湧現。華經產業研究院顯示,中國AI Agent市場規模將於2028年超過8500億元,年複合增長73%。在這瘋狂增長的藍海市場,有投資人認為創業機會在於垂直細分領域的AI Agent,而非定位於寬泛toC場景的通用AI Agent,矛頭直指定位於通用AI Agent的Manus。金沙江創投創始合夥人朱嘯虎在談及GoogleAI大模型正把產品全面AI Agent化時表示:“許多通用AI Agent的創業項目會被打穿,創業一定要遠離‘通用’概念,聚焦於垂直。”大廠入局通用Agent 創業項目打不過今年以來,AI Agent之風同時在國外和中國颳起。5月,微軟、Google相繼召開大會,AI Agent均成為兩家公司的重點。微軟CEO納德拉在大會上表示:“會讓Agent驅動更多微軟的應用程式。”GoogleCEO皮查伊則表示,Chrome瀏覽器、搜尋及旗下AI大模型Gemini將推出AI Agent模式。在中國,AI Agent也是被追逐的業界熱點。首先推出AI Agent產品的是中國創業公司,這些項目聚焦於泛C通用領域。Manus於3月火爆全網,之後其母公司蝴蝶效應獲得了新一輪融資,由矽谷VC benchmark領投7500萬美元。睿獸分析顯示,公司投後估值為5億美元。圖源:Manus另一款通用Agent產品——Genspark,近期也獲得資本關注。該產品由前小度科技CEO景鯤和CTO朱凱華聯合製作,公司已於去年6月獲得藍馳創投6000萬美元種子輪投資,今年2月又獲得1億美元A輪投資,藍馳創投也是投資方之一,據稱公司投後估值漲到5.3億美元。圖源:Genspark在此之後,多家更大型的公司在4月、5月密集發布了通用Agent產品:字節跳動推出扣子空間,可接入飛書雲文件、電子表格、高德地圖等;百度推出通用Agent產品“心響”,可支援簡歷製作、行程規劃、資料分析等200多種任務;崑崙萬維推出Skywork超級智能體,可按照要求,生成專業文件、Excel表格和PPT。隨著中國大公司紛紛湧入通用Agent賽道,通用類AI Agent的創業項目,被中國投資人看衰。金沙江創投創始合夥人朱嘯虎曾發多條朋友圈,看衰通用場景的AI Agent項目,看好垂直場景的AI Agent商業化潛力。明勢資本合夥人夏令就在播客中表示,距離AI大模型主航道太近的通用Agent創業有較大的失敗風險,相較而言,服務於精準人群的垂直Agent才是創業機會。創業邦從多方瞭解到,在大廠紛紛入局的情況下,通用Agent創業項目的成功機率不被看好。InAI Capital創始人竇玉梅解釋道:“通用Agent會面向規模龐大的普通消費群體,需要更多資源支援,更適合已有算力資源和AI大模型底座的大公司。以崑崙萬維為例,它既是算力基礎設施公司,也是最早一批自研大模型的公司,進入通用類Agent應用賽道可能會具有競爭力。”隨著中國大廠紛紛入局,通用Agent的創業機會將愈發縮小。並且,已有相對成熟通用Agent的創業項目,如蝴蝶效應的Manus,在沒有足夠算力儲備,也未自研大模型的情況下,若沒有持續密集的融資支援,難以在中國市場取得業務突破。目前,Manus和Genspark都把業務拓展重心放到海外市場。歐美使用者有較強的付費意願,對訂閱制接受度較高,可以驗證商業化潛力。Manus就宣稱最新融資的款項將用於拓展服務至美國、日本和中東在內的其它市場。蝴蝶效應和阿里巴巴合作的中文版Manus至今處於開發階段而未公佈。不過,通用Agent領域並非毫無機會。原圈科技CEO韓劍認為,使用頻度低的通用Agent產品,大廠做得更好。但是,如果創業者能找到使用頻度很高的通用場景,產品形成高使用者粘性,依舊有機會。“類似於Plaud Note這一創業產品的思路可供參考。它可吸附於手機背面,具備拾音功能,搭載多種AI大模型,可面向會議、醫療、教學等各類場景,進行轉錄、紀要、腦圖生成等功能。由於使用者體驗很好,累計出貨量已超10萬台。”韓劍說。多家垂直Agent今年已獲億元級融資今年以來,中國已有多起關於垂直Agent的千萬元級和億元級融資事件。2025年2月,Liblib AI獲得來自渶策資本和順為資本共同領投的數億元A+輪投資。它的海外團隊製作的產品Lovart一度爆火。該產品專門面向設計師的工作場景,可一句話生成logo、海報、音樂、動畫、品牌套件等全套品牌視覺體系,質量被認為是專業級。在此之前,明勢資本曾在2024年獨家投資了數億元A輪,天使輪由原始碼資本和高榕創投投資。使用者只需手動輸入一個簡單提示詞,Lovart就能在幾分鐘內生成一整套設計方案,而此前設計師需花一周時間。並且,和通用Agent相比,Lovart生成質量更高,所需時間更短。2025年3月,Shulex獲得盛大資本和北極光創投投資的億元級A輪投資。該公司發佈一款面向跨境電商的客服Agent,Solvea。Solvea可替代人工客服,為跨境電商顧客處理退換貨、物流追蹤、投訴管理等。這是該公司的首次公開融資。根據公司描述,公司已服務百家跨境品牌,並且Solvea在客戶意圖識別和客服問題解決等方面表現較好,且能滿足跨境資料合規要求。除上億元級別的融資外,還有多起數千萬元級融資。這些Agent創業公司主要面向面試招聘、醫療問診、市場行銷等垂類領域。例如,面向製造業場景Agent項目的智用開物在天使輪階段就獲數千萬元投資。“即使大公司具備算力、資本等資源優勢,做通用Agent項目更易成功,但是通用Agent無法獲取眾多垂直場景的工作流和資料資源。一旦某一創業團隊在某垂類領域積累深厚,他們創造出的垂類Agent產品,在相同垂類場景下會更加好用。”未盡研究創始人周健工表示。垂類資源賦能垂類Agent產品,這使得許多深耕垂類領域的SaaS公司,找到了新業務增長契機。“SaaS公司已有客戶基礎,懂客戶需求,在此基礎上研發垂類Agent,它的成功機率會比創立於AIGC時代的垂類Agent公司,要高。”周健工認為。不過,也有業內人士認為過往的SaaS經驗會成為研發垂類Agent的絆腳石。原圈科技是一家垂直於行銷領域的Agent創業公司。創始人韓劍於2017年開始聚焦於數位化行銷的創業,多年以來,公司一直專注於行銷SaaS領域,獲得靖亞資本、海納亞洲、常春藤資本的投資。2024年,韓劍重新建構了一套AI Agent的軟體架構,並計畫用這套架構“吃掉”此前研發多年的行銷SaaS軟體,使得原本的SaaS軟體成為該Agent的工具集。目前公司過半的年營收,就來自於垂類Agent產品的銷售。圖源:原圈科技“今天要做好垂類Agent,最好的選擇是把過去甩在一邊。如果過多思考過去,會讓我猶豫,而這種猶豫在徹底變革的AI時代是有害的。”韓劍說:“客戶案例、客戶資料等過往積累的優勢,都抵不過改變的態度來得關鍵。”垂直Agent終究會被 通用Agent打敗?生成式AI融入人們的工作生活越來越深。2025年第一季度,微軟旗下的AI平台的使用量(Token數量)同比增長5倍,總額超過了100兆。在中國,字節跳動旗下AI平台的使用量(Token數量)從2024年5月日均1200億,增長至2025年3月日均12.7兆,一年不到增長100倍。AI不僅持續融入日常生活,而且計算成本也正快速下降。“AI計算成本每年下降到原來的五分之二左右,並且Agent能力會隨大模型迭代和智能體框架創新而不斷變好。成本下降和性能提升疊加起來,再加上Agent在token消耗上的指數提升,未來Agent賽道的想像空間非常大。”一支菸花創始人皮皮認為。皮皮是一位AI虛擬人創業者。在如此富有想像空間的市場中,垂類Agent所構築的“護城河”,可能在長期會受到通用Agent不斷增強的AI泛化能力的威脅。東吳證券研報認為,雖然垂直Agent憑藉其深度領域知識和定製化能力在短期內具有發展空間,但是通用Agent的泛化浪潮對垂直Agent構成了長期且顯著的威脅。不過,韓劍認為未來並非一定會如此演變。“AI強化學習已是如今AI應用的主流技術範式,通用Agent難以做好某一垂直領域的強化學習,所以它的生成結果比不上垂類Agent。就像目前AI大模型無論通過何種方式訓練,在圍棋領域也無法打敗Alpha Zero,因為Alpha Zero是運用全球頂尖圍棋選手資料,並迭代出一套專門用於圍棋領域的演算法而成的。”周健工則認為,不論通用Agent攻入垂直領域,還是垂直Agent進入通用範疇,都有機會。“通用和垂直的邊界是不斷動態變化的。正如紅杉資本所言,現在使用者需要的是結果,而非工具。但凡能提供最好結果,使用者不會在意這一結果是通用Agent或是垂直Agent做的。” (創業邦)
Manus全面開放註冊,一文詳解AI Agent原理和價值
今年爆火的AI Agent應用Manus在5月13日宣佈全面開放註冊。此前,Manus因嚴格邀請制導致黑市交易火爆,邀請碼曾被炒至 10 萬元。2025年以來,相信大家都能夠明顯感受到AI Agent備受市場的關注。業內普遍認為,2025年將是Agent爆發之年。Gartner預測,到2028年,至少15%的日常工作決策將通過Al Agent完成。 微軟、Google、阿里等科技巨頭紛紛佈局卡位,OpenAI、智譜、Monica等初創公司們也爭相推出各自的“Agent”產品且已嶄露頭角。本文會從這款火爆的AI Agent產品Manus談起,來具體分享關於AI Agent的概念、技術原理、價值、以及未來趨勢。一、Manus是什麼?如何註冊體驗?關於ManusManus是一款由中國團隊Monica.im推出的AI 應用產品。2025年3月推出,被稱為“全球首個通用型AI Agent”。其名稱源自拉丁語“手”(Manus),寓意“思考與行動並重”。它是AI應用產品,不是一個大模型,所以跟DeepSeek不是一回事,所以不要和大模型混淆。這款產品的下功夫的地方主要是在我們上篇文章裡講的「應用層」,基於多智能體(multi-agent)來實現複雜且多變的通用任務處理能力。與ChatGPT、DeepSeek不同,Manus 是一款通用 AI 智能體,Manus擁有更多的技能,能夠自動規劃並一次性組合多種技能,解決一個複雜的應用場景問題的AI智能體。ChatGPT本質上是一個以大模型為主的生成式AI應用,它目前只能解決一些跟內容生成有關的問題,解決不了跟生成無關的問題,包括自動化任務,或者跨平台執行任務,比如部署網站、幫你訂餐等,這些跟生成式AI無關;而Manus AI更像是一個自主規劃並執行任務的機器人,生成式AI只是它的一部分能力,除此之外,它還能能自主執行自動化任務,或者跨端執行任務;而現實的應用場景中,使用者並不是只有AI生成的需求,還有自動化任務相關的需求,這是很多使用者認可它的原因,也就是Manus不僅思考,更能交付結果。它的功能特性體現在:實現 “思考 - 規劃 - 執行” 全流程閉環。例如當你想要AI幫你完成一份某某行業的產業鏈分析報告PPT,ChatGPT可能會幫你生成提綱和每個章節的主要內容梗概,然後你可以自己繪製PPT或者單獨找到一個PPT自動生成的AI工具幫你生成PPT。而Manus則可以自動幫你:1. 規劃:將該指令拆解為“建立Python檔案-爬取資料-生成圖表-創作分析報告-生成PPT”這個過程;2. 執行:完成整個過程所有的任務,自動去對接資料、呼叫PPT工具生成PPT。3. 最終直接將一份完整的PPT奉上。整個過程不需要人工介入。可以解決更多的通用場景問題。你可能會說有些PPT的AI生成工具也可以一句話指令幫我們生成PPT,但是對於Manus,它可以完成各種類型的任務,也就是為什麼它被稱為“通用型AI Agent”。除了生成PPT,它還可以完成圖片視訊生成、報告生成、程式碼編寫和部署、幫你打開某個網站等各個類型的任務。相比之下,ChatGPT等產品,是不能幫我們完成這麼多執行類任務的;相比一些專用的工具,如AI生成圖片、AI生成PPT的應用,我們也只能完成特定類型任務,你無法對他們提出幫你建構一個網站並部署這樣的超綱要求。總體而言,ChatGPT像一個“有頭腦有嘴的對話助手”,Manus更像一個“有頭腦有手有腳的自主打工人”,而且是一個“綜合能力強”的“自主打工人”。有了這款工具,理想的情況下,我們只需要“一句話需求”,就能得到一份“高品質的結果”,不需要我們再次人工調整。是不是聽起來相當的美妙?那麼實際上,這款產品在實際體驗上是否真的能達到這樣的水平?關於這款產品的具體能力測評網上有很多,一些使用者對Manus的高效和智能感到驚豔,但也有使用者則認為它“不成熟、難用”,並未達到預期效果。這款應用目前已經全面開放註冊體驗,大家可以親自體驗一下。下面附上註冊體驗教學,非常簡單。Manus如何註冊體驗1. 訪問Manus AI 官方地址:https://manus.im/注意:此處需要科學上網,如果使用的是國內的網路,會自動跳轉到manus中文網,中文網目前還沒有可用的服務。2.點選右上角的「開始使用」,進入註冊頁面。可以使用信箱進行註冊,或者Google或Apple帳號註冊。我選擇的是Apple帳號,使用Apple帳號註冊時,注意後面不要選擇隱藏信箱地址(我選隱藏時失敗了)。註冊過程最後一步會要求繫結手機號,手機驗證碼驗證通過後,即註冊成功。3.註冊成功後,就可以看到manus的服務首頁面了。註冊後會獲取1000個免費積分+註冊當日的300積分。後續每天會贈送300積分用於執行任務。4.在對話方塊給輸入任務要求,就可以執行了。二、AI Agent的概念和工作原理暢想一下,目前我們在工作中使用電腦時,往往在各個桌面軟體和瀏覽器網站之間穿梭。而當AI Agent與我們的各類辦公工具和企業應用軟體完成深度融合後,我們工作的模式將發生改變:我們不再需要挪動滑鼠“不斷往復的軟體操作”,我們只需要提出我們的需求,AI Agent自動幫我們來“穿梭操作”,我們只需要等待,直接拿到一個符合我們要求的結果。是不是很不錯?這裡提到的關鍵概念就是AI Agent,下面我們就來瞭解一下AI Agent的概念內涵、原理和應用價值和未來潛力。AI Agent是什麼AI Agent(人工智慧體)是能夠感知環境、自主規劃、進行決策和執行動作以實現目標的智能體,具有自主性、互動性、反應性、適應性等基本特徵,其核心驅動力為大語言模型。大致來說,一個智能體應具備類似人類的思考和規劃能力,擁有記憶甚至情感,並具備一定的技能以便與環境、智能體和人類進行互動。智能體所描述的能力範圍邊界,可以大致總結為以下公式:LLM 和 Al Agent 的區別在於:Al Agent 可以獨立思考,並做出行動。關於AI Agent的工作原理,這裡整理了兩個版本,我們先學術,再具象通俗。AI Agent架構智能體的架構我們可以從不同的視角去拆解,下面我們分別從能力視角和系統視角去看。從智能體的能力視角上看,OpenAI 的應用研究主管 Lilian Weng 提出了 Agent = LLM + 規劃 + 記憶 + 工具使用的基礎架構,其中 LLM 扮演了 Agent 的“大腦”,在這個系統中提供推理、規劃等能力。從系統工程視角上看,2024 年 Google 團隊發佈的 Agents 白皮書將AI Agent分為“思考模組”(模型)、“執行模組”(工具)、“流程控制模組”(編排)。模型:是用作 Agent 中用來做核心決策的語言模型(LM)。可以是通用的、多模態的,或根據特定 Agent 架構的需求微調得到的模型。與普通模型不同,Agent 中的模型具備原生邏輯層,內建複雜推理框架。工具:基礎模型在文字和圖像生成方面非常強大,但無法與外部世界聯動極大限制了它們的能力。 工具的出現解決了這一問題,工具層突破語言模型的靜態知識限制,賦予即時資料訪問與現實世界互動能力。例如,結合使用者資訊和獲取天氣資料的 tool,Agent 可以為使用者提供旅行建議。2024年11月25日,Anthropic開源了劃時代的“模型上下文協議”(MCP),MCP解決了資料獲取和功能獲取等API的統一接入問題。編排層:描述一個循環過程:Agent 如何接收資訊,如何進行內部推理,如何使用推理來結果來指導其下一步行動或決策。一般來說,這個循環會持續進行,直到 Agent 達到其目標或觸發停止條件。編排層的複雜性跟 Agent 及其執行的任務直接相關,可能差異很大。 例如,一些編排就是簡單的計算和決策規則,而其他的可能包含鏈式邏輯、額外的機器學習演算法或其他機率推理技術。雖然以上是兩種不同的視角,但是這兩種架構的拆分部分的對應關係如下:AI Agent 的工作原理(通俗版)為了方便大家理解,準備了一個更加通俗的工作原理介紹。簡單來說,AI Agent 就像一個聰明的“任務小管家”,能聽懂你的需求→自己想辦法→找工具幹活→再調整直到完成目標。它的核心由三層協作完成(模型、工具、編排層),配合過程可以理解為三步循環:模型層(大腦)- 決策中心相當於 Agent 的“大腦”,負責理解問題和規劃步驟。 例如,“訂機票”任務中,模型需要判斷:“使用者要飛那?需要我查航班?還是查天氣?”但模型只會“動腦”,和普通人一樣無法徒手查航班或發郵件,必須靠工具。工具層(手腳和感官)- 行動觸手當模型需要行動(例如“查北京天氣”),自動選合適工具→傳送指令→等待工具返回結果。工具類型:查資料工具:像“瀏覽器”,能搜尋即時資訊(如航班時刻)。執行工具:像“手”,可執行指令(如傳送郵件、訂機票)。儲存工具:像“文件庫”,儲存專屬知識(如公司內部資料)。編排層(流程管理員)- 循環督導確保計畫不跑偏,像“監工”一樣循環檢查: 觀察 → 思考下一步 → 呼叫工具 → 再觀察 → 直到目標達成。實際例子🌰:訂機票流程整個過程就像 “人腦思考→用手操作工具→不斷修正” 的自動化版本,最終幫你搞定複雜任務。三、AI Agent的應用價值2024年5月,微軟公司創始人比爾·蓋茲公開表示,AI Agent不僅會改變每個人與電腦互動的方式,還將顛覆軟體行業,帶來從鍵入命令到點選圖示以來,最大的計算革命。Gartner預測,到2028年,至少15%的日常工作決策將通過Al Agent完成。 微軟、Google、阿里等科技巨頭紛紛佈局卡位,OpenAI、智譜、Monica等初創公司們也爭相推出各自的“Agent”產品且已嶄露頭角。目前的主流AI Agent產品目前AI Agent產品可以分類兩類,一類是智能體應用,一類是用於建構智能體的低程式碼平台。通用智能體應用(提供任務執行能力):也就是開篇介紹的Manus這種,直接面向使用者提供一個通用的智能體應用,讓使用者能夠直接發佈指令,智能體完成任務。如:Manus:支援複雜任務處理執行。AutoGPT:自動完成程式碼生成/網路搜尋等跨平台任務通用AI智能體搭建工具(低程式碼平台):這類平台為使用者提供建構AI智能體應用的功能,也就是將上面提到的編排、模型、工具等工作原理能夠通過這個平台進行完整編排和搭建。以下是目前一些市場上主流的產品,這些廠商基於自有的大模型,搭配豐富的API和MCP,並提供工作流編排能力,以及更加便捷的項目示例或範本,讓使用者能夠輕鬆完成一個智能體應用實例的搭建。Agent的未來價值據麥肯錫預測,到2030年AI Agent將推動全球GDP增長1.3兆美元,企業級市場規模達2850億美元。關於未來價值,這裡直接貼上2024 年 Google 團隊發佈的 Agents 白皮書中的總結:“Agent的未來將非常激動人心。 隨著工具變得更加複雜,推理能力得到增強,Agent 將被賦予解決現實生活中越來越複雜的問題的能力。此外,“Agent chaining” 也將是一個戰略性方向, 通過結合 specialized Agents —— 每個 Agent 在其特定領域或任務中表現出色 —— 可以建立一種 “mixture of Agent experts”(混合智能體專家)的方法,能夠在各個行業和問題領域中提供卓越的性能。最後需要說明,複雜的 Agent 架構並不是一蹴而就的,需要持續迭代(iterative approach)。 給定業務場景和需求之後,不斷的實驗和改進是找到解決方案的關鍵。Agents 底層都是基於基座大模型,而後者的生成式性質決定了沒有兩個 Agent 是相同的。 但是,只要利用好這些基座模型,我們可以建立出真正有影響力的應用程式, 這種應用程式極大擴展了語言模型的能力,帶來了真實的現實世界價值。”本文到這裡就結束啦,感謝您能閱讀到此處,希望通過這篇文章能夠讓大家對AI產生一些新的認識和收穫。後面會針對AI的能力邊界和未來與人類的協同模式梳理和分享一些優質的前沿觀點。 (WonderLearner)
Manus vs ChatGPT!比拼任務執行能力,誰更勝一籌?
隨著AI技術的發展,AI Agent(智能體)概念愈發火熱。曾經「一碼難求」的AI Agent平台Manus於近日全面開放註冊。根據官方公告,新註冊用戶每天可免費獲得300積分,並額外一次性獲得1000積分。Manus試圖串聯真實世界工具鏈,但目前執行過程尚未實現穩定高效。為了驗證其實用性和任務完成能力,小K以一名普通用戶的身份,親自註冊了Manus,獲得了1300積分,並對其與生成式AI聊天機器人的代表產品ChatGPT分別進行了兩個真實任務的測試。第一個測試任務是:下載Manus產品負責人張濤在Manus推出前發布的一段名叫“為什麼以前我不愛和人聊Agent”的演講視頻,提取MP3音頻,轉寫成文字,並進一步生成PDF和PPT文件。Manus接收到指令後,開始了一場漫長且曲折的「系統工程之旅」。它不斷在Linux沙箱的終端機中嘗試安裝如BBDown、you-get、FFmpeg、Whisper等工具。其過程中不斷回顯各種技術日誌,看起來更像是一位在調試腳本的工程師。一旦遇到環境異常就重置沙箱,從頭開始全部流程。不過,Manus多次重試安裝語音辨識模組Whisper,但皆未安裝成功,由於耗時過長,小K主動要求Manus跳過轉寫和產生PDF和PPT檔任務,直接輸出MP3音訊。最終,Manus輸出了MP3音頻,並將這份MP3嵌入到一個自動生成的網頁中並部署上線。整個任務耗時約一小時,在未完成文字轉寫、PDF、PPT的情況下積分一次性消耗了1000點。令人感到落差的是,明明可以透過一次簡單的API呼叫快速完成的任務,Manus卻將流程人為拆解成多個步驟,從而製造出「AI很忙」的錯覺。這種「任務複雜化」的做法雖然反映出平台對自動化流程的執著,但也大大拉長了執行時間,耗費了更多資源。而面對相同要求,ChatGPT明確表示無法進行影片下載和轉換,但可以提供內容摘要與簡報提綱。在小K確認後,ChatGPT在1分鐘內就基於影片產生了400字摘要,包括張濤的轉變邏輯、技術演進、Agent產業趨勢的詳盡大綱,並建議了PPT結構設計。在小K進一步提出產生PDF和PPT後,它迅速完成並提供了可直接下載的檔案。雖然ChatGPT不能原始下載視頻,未能輸出MP3音頻,但完成了有組織的、高質量的文字總結和PPT、PDF生成,對資源不可達的場景有自適應應對機制,任務完成度相對Manus更高,用戶體驗更高效、有邏輯,其內容提煉能力極強,適合需要快速摘要的場景,節省了等待與調試的時間。第二個測試任務是:幫我制定3天東京自由行:①產生行程表(含地址/營業時間),②查公共交通路線併計算預估費用,③訂3家拉麵店午餐位,如需驗證碼或付款請停止並提示我。Manus整整花了20多分鐘「逐項收集資料」,包括透過呼叫網路資料來源擷取景點,查詢每個景點的地址與開放時間;計算每日交通路線和預計費用;篩選東京著名拉麵店,並嘗試預約。然而Manus給出的最終結果是,大部分熱門拉麵店(如“饗くろ喜”、“銀座篝”、“一蘭拉麵店”等)均不接受線上預訂,通常需要現場排隊等候,部分店舖或可嘗試電話諮詢,但不能保證預訂成功。建議在午餐時間前提早前往或做好排隊準備。Manus輸出了一份包含3日詳細行程、景點地址和營業時間、交通費用估算的markdown文檔,所有內容自動整理為文件輸出,任務完成度高。不過,內容結構偏「流水帳」式,等待時間冗長。令人沮喪的是,Manus的積分消耗速度也十分驚人。完成第一個任務後,小K只剩300點。雖然評分回贈了100分,也僅稍微緩解損耗。第二個自由行任務提交後,Manus扣除了351點。短短兩次任務,小K帳戶中的積分便已耗盡,未留下任何可持續使用的餘裕。由此看來,Manus每日免費贈送的300點可能還不夠一次完整任務,結合任務實際執行情況來看,Manus性價比並不高。與之相比,ChatGPT快速識別旅行任務並立即產生以下內容:含順序、景點、營業時間的3天行程建議;每天午餐推薦拉麵店,並說明預約方式;公共交通推薦(如Suica卡、一日券);費用估算(2400–3000日元)。最終行程排版美觀,內容結構自然、可讀性強,整個過程高效、連貫、無需等待中間步驟。ChatGPT雖然沒有直接嘗試在線預訂拉麵店,但清楚地列出各拉麵店的預約平台和連結。綜上所述,從這兩個任務的實踐來看,Manus的定位更接近一個“自動執行型AI”,它試圖串聯真實世界中的工具鏈,實現從網頁抓取到工具調用、文件部署的完整流程。它最大的優勢在於“能幹活”,尤其是面對結構明確、步驟清晰的任務鏈時,能主動完成流程性、跨步驟的任務(如下載、轉換、部署、查詢)。然而,它執行過程冗長、穩定性不足、智慧應變能力較弱,且算力資源消耗偏高。而以ChatGPT為代表的生成式AI聊天機器人則使用類人對話的形式,擅長理解模糊需求,快速提供結構清晰、表達得體、可直接使用的內容方案,算力資源消耗較少。當然,隨著AI Agent技術的逐步成熟,Manus這類平台仍有其價值。它讓我們看到未來AI不僅僅是“說話”,而是可以主動執行任務、部署網頁、與工具鏈互動。只是這一切尚未穩定,也未必有效率。如今的AI Agent,更像是一位尚在成長中的熱情滿滿、略顯笨拙的技術實習生,如果未來其能和生成式AI聊天機器人更好地結合——生成式AI聊天機器人提供智能交互,AI Agent負責流程執行,或許才是用戶真正需要的“全能AI”。(財聯社AI daily)
天空精讀| AI教父談世界沒準備好,楊立昆最新講座,Perplexity CEO哈佛講創業,YC總裁談AI智能體Manus突破
【城主說】即日起,天空之城和大家日常分享最新AI科技長訪的內容精讀合集。感謝科技的進步,每一個長訪都可以有萬字全文,但或許更稀缺的是時間。希望本城日常精讀可以幫助大家在最有限時間裡掌握最新的科技商業認知。同時附上完整視訊和全文的連結,感興趣的同學可以繼續針對特定內容深入瞭解。天空科技商業精讀04.28| 內容目錄• AI教父辛頓:世界還沒有為即將到來的一切做好準備 20250426• Yann LeCun教授講座 @新加坡國立大學NUS120周年20250427• Perplexity CEO:從學者到90億美元AI先驅 |哈佛商學院創業峰會 20250425• YC總裁:AI智能體的下一個突破就在這裡(Manus) 20250408AI教父辛頓:世界還沒有為即將到來的一切做好準備 20250426視訊和全文連結:https://www.bilibili.com/video/BV1irLCzME2L/內容精讀:傑弗裡·辛頓因其在機器學習領域的開創性工作獲得認可,他在1986年提出的使用神經網路預測序列中下一個詞的概念,奠定了當今大型語言模型的基礎。儘管他預見到人工智慧可能在教育、醫學和氣候變化等領域帶來變革,但他對人工智慧進展的速度深感擔憂,將其比作飼養一隻幼虎,無法確定其長大後是否會構成威脅。辛頓預測人工智慧可能加劇獨裁統治,增強駭客能力,並大膽猜測人工智慧有10%到20%的風險會取代人類,他甚至為此將存款分散到三家銀行。核心問題在於,我們能否設計出永遠保持仁慈、不想掌控一切的人工智慧。          辛頓擔憂,科技公司間的激烈競爭,正驅使它們為了短期利潤而愚蠢自私地將全人類置於危險之中,它們甚至遊說反對加強本就薄弱的人工智慧監管。這種對當權派的反抗精神貫穿辛頓的人生:他曾因美國人工智慧資助與國防部掛鉤而移居加拿大,並在神經網路被視為不可行時堅持研究數十年。他將這種逆向思維和堅持歸因於家庭影響,包括他的昆蟲學家父親,以及更早的先輩如喬治·布林和喬治·埃佛勒斯,並認為自己繼承了對機械事物運作原理的好奇心。          辛頓坦言,他喜歡“修補”事物,無論是修理損壞的相機濾鏡,還是花費大量時間調整神經網路模型以理解其行為,這種動手探索是他研究方法的一部分。他回憶起與他最著名的門生、後來成為OpenAI首席科學家的伊利亞·蘇茨克維爾一起觀察模型學習並預測結果的時光。辛頓對蘇茨克維爾參與罷免OpenAI首席執行官薩姆·奧特曼(據報導是出於安全擔憂)表示讚賞,但也認為蘇茨克維爾此舉很“天真”,因為此舉危及了員工即將獲得的巨額財富,最終奧特曼回歸,蘇茨克維爾離職。          辛頓同樣對Google等前僱主及其他前沿人工智慧公司(包括Meta)表示失望,批評它們違背了不將人工智慧用於軍事目的的承諾,並認為它們在安全投入上嚴重不足,例如用於安全研究的計算資源比例遠低於應有的水平(如三分之一)。他認為需要政府監管,但對此並不樂觀。儘管擔憂未來,辛頓表示自己並未感到絕望,主要是因為他和其他人一樣,在情感上難以真正接受這個歷史性的特殊時刻——一個一切可能在短時間內發生前所未有規模劇變的時刻。各大人工智慧實驗室在被問及安全研究投入時,雖聲稱重視安全並原則上支援監管,但大多迴避具體數字,並反對現有的監管提案。❖ ❖ ❖Yann LeCun教授講座 @新加坡國立大學NUS120周年系列 20250427視訊和全文連結:https://www.bilibili.com/video/BV1EALmzDEFV/內容精讀:在新加坡國立大學120周年傑出講座系列中,Meta副總裁兼首席人工智慧科學家、紐約大學教授楊立昆(Yann LeCun)分享了他對人工智慧創新未來的見解。他強調,儘管當前人工智慧特別是大型語言模型(LLM)取得了顯著進展,但它們距離實現真正類似人類的智能還有很長的路要走。建構類人智能系統的目標並非取代人類,而是增強人類智能,這需要機器能夠理解物理世界、具備常識、推理、規劃能力和持久記憶。          楊立昆指出,當前主流的LLM本質上是基於自回歸預測進行訓練的,即根據之前的詞元預測下一個詞元。雖然擴大模型規模和資料量能提升其能力,但這存在根本性侷限,無法帶來真正的理解、規劃和推理能力,更無法解決從未見過的新問題。他認為,僅僅依賴文字資料進行訓練是遠遠不夠的,人類嬰兒通過感官(尤其是視覺)在短短幾年內接收的資訊量遠超當前LLM的訓練資料量,這說明了理解物理世界對於智能的重要性。          他批判了當前AI領域,特別是LLM存在的侷限,例如缺乏對物理世界的深刻理解(莫拉維克悖論),無法進行有效的規劃和推理,以及學習效率遠低於人類和動物。他認為,過度迷信LLM的擴展能力是錯誤的,這是AI發展史上反覆出現的錯誤認知。          為了克服這些侷限,楊立昆提出需要新的架構和學習範式。他倡導建構能夠通過觀察和互動學習世界模型的AI系統。這種世界模型能夠預測行動的後果,是實現規劃和推理能力的基礎。他強調了通過最佳化進行推理(類似人類的系統二思維)的重要性,這比LLM的固定計算量前饋推理更為強大。          他重點介紹了自監督學習(SSL),特別是“聯合嵌入預測架構”(JEPA),作為學習世界模型的關鍵方法。與試圖預測輸入(如視訊像素)細節的生成式方法(如GAN、擴散模型)不同,JEPA旨在學習輸入的抽象表示,並在這些表示空間中進行預測。他認為,預測高維輸入的每一個細節極其困難且低效,而學習合適的抽象表示進行預測才是更有效的路徑,這類似於科學研究中尋找關鍵變數進行預測的過程。他展示了iJEPA、vJEPA等方法在圖像和視訊理解上取得的優於生成式方法的初步成果,並認為這類方法有望讓機器像嬰兒一樣學習世界的運作規律,包括直覺物理學等常識。          楊立昆還指出了分層規劃是實現高級智能的另一個重大挑戰,即系統需要能像人一樣將複雜目標分解為子目標,並在不同抽象層次上進行規劃。當前AI系統在這方面能力欠缺,這是一個亟待解決的核心問題。          最後,他提出了一些頗具爭議的建議:研究重心應從生成模型轉向JEPA等非生成式表示學習方法;放棄機率模型而採用基於能量的模型;摒棄對比學習,傾向於正則化或蒸餾方法;並儘量減少對效率低下的強化學習的依賴。他總結道,LLM雖然有用,但對於追求真正的人工智慧(他稱之為AMI,高級機器智能,而非AGI)而言可能是一個“彎路”。未來的突破在於開發具備世界模型、推理、規劃能力,並能理解物理世界的AI系統,這有望在未來3到10年內實現,並最終帶來真正有用的智慧型手機器人。          當前,人形機器人製造的熱潮席捲業界,眾多公司投身其中。然而,一個公開的秘密是,我們尚未掌握賦予這些機器人足夠智能以實現廣泛應用的技術,現有能力僅限於狹窄任務。這些公司寄望於未來三到五年內人工智慧取得突破性進展,以匹配其硬體的商業化處理程序,但認為當前技術足以支撐通用人形機器人的想法是錯誤的。          開源平台的必要性日益凸顯,它不僅能讓資源有限的學術界參與到昂貴的基礎模型訓練中,貢獻智慧,也關乎維護國家主權以及文化和語言的多樣性。          大型語言模型(LLM)無疑極具價值,特別是在提升編碼效率、輔助理解複雜文件等方面,它們是實用的生產力工具,並將持續改進可靠性與多語言能力。但不應將其視為通往人類水平人工智慧(AGI)的路徑。它們很可能成為未來更複雜AI系統的組成部分,例如負責將系統的抽象思想轉化為連貫的文字,但它們本身並非實現AGI的關鍵。          面對人工智慧引發的就業焦慮,未來並非黯淡無光。儘管各行各業包括教職都將受到影響,但經濟學家的分析指出,技術革命雖會改變工作性質,卻不會導致工作崗位的枯竭,因為待解決的問題層出不窮。技術的經濟滲透需要時間,對生產率的顯著影響往往需要十多年才會顯現。AI帶來的GDP增長增量預計雖可觀(年均約0.7%的額外增長),但這並非意味著短期內會出現大規模失業。          因此,對於年輕人而言,學習具有長久生命力的基礎知識和方法論至關重要,例如選擇基礎科學(如量子力學)而非短期應用技能(如特定移動應用程式設計)。培養快速學習新事物的能力和深度思考能力,才能在技術飛速迭代的時代立於不敗之地,甚至成為管理AI系統的專家,擁有深厚的技術理解將是巨大優勢。          在金融等特定領域,AI的預測能力需克服市場的高度隨機性。JEPA這類旨在消除噪聲、在抽象層面進行預測的系統或許能提供新思路,但尚無定論。機器人領域同樣需要突破,僅靠視覺遠不足夠,觸覺等多模態感知對於與物理世界互動至關重要,目前這一領域開發尚不充分,但JEPA等方法有望整合不同模態資訊。Meta等公司已將具身人工智慧和機器人技術視為重要的拓展方向。          值得注意的是,許多科學領域的AI突破(如AlphaFold)並非依賴LLM,而是採用專門設計的模型和自監督學習等技術。實現完全自主的AI科學家仍是遙遠的目標,且其核心可能並非LLM,而是更接近於能建構世界模型、進行分層表徵和規劃的架構。強化學習(RL)在智能體系中的作用更像是“錦上添花”,而非核心驅動力,其樣本效率問題限制了在現實世界(非遊戲)的應用。          像Llama這樣的開源基礎模型,如同作業系統Linux,提供了強大的基礎設施,而非即用型產品。其真正價值在於允許開發者根據特定需求進行微調、定製和本地化部署,降低成本並促進創新,從而減少幻覺等問題。訓練這些模型需要極其多樣化的資料,不僅包括自然場景,還需包含物體互動、不同環境、甚至簡化圖解化的內容(如動畫片),以幫助系統學習世界的基本運行規律。          展望未來,我們與數字世界的互動將深度依賴AI助手。為了避免資訊流被少數科技巨頭壟斷,維護全球文化和語言的多樣性(全球約6000種語言及大量非數位化文化資訊),開源是必然趨勢。需要建構能理解全球語言、文化、價值體系的基礎模型,這無法由單一實體完成,而應由全球多方協作。基礎模型將成為公共基礎設施,通過全球性的合作夥伴關係共同訓練,正如網際網路最終由開放原始碼軟體棧支撐一樣。這為新加坡等地提供了契機,可憑藉算力、人才和區域資料優勢,成為共建全球共享AI基礎的樞紐,確保AI服務於全人類的多元需求。開源最終將在人工智慧領域勝出,只是時間問題。✧ ✧ ✧ ✧ ✧Perplexity CEO:從學者到90億美元AI先驅 |哈佛商學院創業峰會 20250425視訊和全文連結:https://www.bilibili.com/video/BV154LyzqEA7/內容精讀:2025年哈佛商學院創業峰會迎來了重啟,匯聚了學生、校友及社區領袖,展現了學院濃厚的創業精神。此次峰會的核心環節之一是X Fund管理普通合夥人Patrick Chung對Perplexity首席執行官Arvind Srinivas的訪談。Arvind擁有印度理工學院馬德拉斯分校的工程學位和加州大學伯克利分校的電腦科學博士學位,他於2022年聯合創立了人工智慧驅動的對話式搜尋引擎Perplexity。該公司在短時間內實現了顯著增長,月查詢量超6億次,估值達90億美元,並獲得了傑夫·貝索斯和輝達等知名投資者的支援。          訪談中,Arvind分享了他從學術界走向創業的歷程。他出身於重視知識而非財富的印度家庭,父母甚至更為他的博士學位感到驕傲。儘管本科學習電氣工程,但他通過參加機器學習競賽(並意外獲勝)以及後續實習,接觸並深入學習了機器學習和神經網路,包括線上學習吳恩達、傑弗裡·辛頓的課程,並在圖靈獎得主Yoshua Bengio處實習,最終進入伯克利深造。在OpenAI和DeepMind的實習經歷讓他認識到,將想法付諸實踐、處理實際資料並完成端到端工作的能力至關重要,這推動了他走向創業。OpenAI前首席科學家Ilya Sutskever的直接反饋,特別是強調生成式無監督學習結合大規模算力和資料是通往通用人工智慧(AGI)的關鍵,深刻影響了他的研究方向。          Arvind認為,《矽谷》這部劇雖幽默卻真實反映了創業生態,從零創造並交付產品的想法極具吸引力。當GitHub Copilot等產品讓他“感受到AI”的實際應用時,他意識到創辦AI公司的時機已到——AI開始顯現威力,但尚未完全成熟。Perplexity於2022年8月應運而生。尋找聯合創始人時,他先與學術上相識的Dennis Yarats合作,隨後說服了Dennis在Quora認識的、當時正考慮職業變動的優秀工程師Johnny Ho加入。他們最初嘗試了文字到SQL的應用,但關鍵的認知是初創公司必須快速迭代、發佈產品、獲取使用者反饋並據此調整,而非在“想法迷宮”中空轉。通過展示產品演示而非簡報,他們成功吸引了種子輪投資者,這反過來又幫助吸引了頂尖的創始工程師。團隊不斷迭代,最終聚焦於核心理念:改變搜尋這一基礎軟體的形態,從關鍵詞轉向問題或語音輸入,並提供帶有來源、可驗證的即時答案,這一理念源於學術寫作中引用溯源的要求。Perplexity的核心產品原型在一個周末駭客松(基於前期準備)後誕生,並通過小範圍試用迅速驗證了價值。          對於Perplexity與Google的關係,Arvind認為兩者並非直接競爭所有場景。Google在處理簡短、導航式搜尋(如輸入“天氣”)方面通過“讀心術”般理解使用者意圖已做到極致,Perplexity在此難有改進空間。然而,Google在回答需要資訊綜合的複雜問題(如“下雨天去哈佛該穿什麼?”)方面表現不佳,這正是Perplexity的優勢所在。Google受制於廣告模式,難以對所有查詢提供直接答案,因為這會減少連結點選和廣告收入,導致其搜尋結果頁面日益混亂。Perplexity則嘗試不同的模式,包括與內容出版商分享收入,以激勵高品質內容的創作,這與Google讓出版商依賴AdSense的模式不同。          針對Perplexity只是“API封裝器”的誤解,Arvind強調,雖然早期版本可以快速建構,但公司後續投入巨大,已建立自有模型、索引和爬蟲基礎設施,並開發了複雜的、按步驟思考的“研究代理”。即使所有第三方模型停止供應,Perplexity也能基本維持現有服務質量。公司對與蘋果等平台合作持開放態度。關於此前競標TikTok的願景,他希望能將資訊流變得更具生產力,利用AI進行事實核查,並利用TikTok的搜尋入口建構下一代搜尋體驗,從而更好地與Google競爭。          從學術界到創業界,Arvind認為核心思維方式有所轉變,從重思考轉向重行動和迭代學習,但學術界的嚴謹性,如小規模實驗和批判性思維,在創業中同樣重要。他對AI的未來持“加速主義”樂觀態度,希望通過廣泛可及的AI(如iPhone模式)避免權力集中帶來的風險。他認為開源是制衡AI領域壟斷的關鍵力量,不斷湧現的高品質開源模型確保了技術的普及。展望未來,他認為AI的下一個重大突破可能在於實現極長的上下文處理能力,讓AI擁有更持久的記憶和理解力,超越當前依賴檢索增強生成(RAG)的模式。          在問答環節,Arvind提到,AI領域仍面臨計算能力(GPU)短缺的限制,成本是挑戰,期待更高效的晶片(如輝達Blackwell)和知識蒸餾技術緩解壓力。他再次強調開源和透明度(展示來源和思考過程)是確保AI倫理和防止敘事被單一公司操控的關鍵。他預測,隨著AI能力的增強,傳統搜尋引擎最佳化(SEO)的重要性將下降。對於公司戰略,Perplexity專注於短期(季度)規劃,當前重點是擴展到天氣、體育、購物、旅行等結構化答案垂直領域,開發瀏覽器以整合個人資料實現個性化,並探索原生交易功能。他強調公司文化是快速適應,從不成功的項目中學習並迭代,例如將Perplexity Pages的技術復用於Discover Feed。他認為量子計算目前對產品公司而言為時尚早。          最後,Arvind分享了他的個人感悟:創業路上要保持冷靜,認識到情況“永遠不會像看起來那麼好,也永遠不會像看起來那麼糟”。他引用埃隆·馬斯克關於永不放棄的精神作為激勵,強調堅持是成功的關鍵。✧ ✧ ✧ ✧ ✧YC總裁:AI智能體的下一個突破Manus就在這裡 20250408視訊和全文連結:https://www.bilibili.com/video/BV1bBLyzFET3/內容精讀:隨著OpenAI、Google、XAI及DeepSeek等平台推出可用的AI代理,一個新的競爭者Manus也已登場,這個全新的代理式AI平台在全球引發關注。Manus作為首個通用AI代理的早期預覽版已經發佈,並迅速激起熱議,被部分人視為中國繼DeepSeek後的又一重要時刻,稱讚其為體驗過最令人印象深刻的AI工具和最先進的AI電腦使用方式。與前輩不同,Manus並非僅是專業的聊天機器人,而是致力於成為真正的通用AI代理,但其訪問受限,其實際變革能力仍待觀察。          Manus的核心創新在於其多智能體人工智慧系統,該系統能處理從旅行規劃、財務分析到檔案搜尋和行業研究等多樣化任務。其運作方式並非依賴單一大型神經網路,而是像一位執行官,協調一個由規劃智能體、多個專業子智能體(負責知識、記憶、執行等)組成的團隊。系統首先分解使用者任務為子任務,規劃執行路徑,然後分配給相應的子智能體。這些子智能體共享上下文,各自擁有專業領域,並能呼叫包含29種整合工具的廣泛工具集,智能決策使用何種工具完成網頁導航、程式碼運行或資訊提取等任務。最後,執行者代理整合所有子任務的輸出,生成最終結果。          該系統由複雜的動態任務分解演算法驅動,能自主拆解複雜指令。為保證穩定性,Manus團隊研發了“思維鏈注入”技術,使代理能主動反思和更新計畫。其核心模型採用了Anthropic的Claude 3.7 Sonnet,並無縫整合了YC Company瀏覽器等開源工具及Startup E2B的安全雲沙盒環境,具備強大的跨平台執行能力。Manus擅長建立旅行行程、財務分析、教育內容,以及處理結構化資料庫編譯、保險比較、供應商篩選和簡報製作等實際任務。在衡量AI代理推理、多模態處理、網頁瀏覽和工具使用的Gaia基準測試中,Manus得分高達86.5%,超越了OpenAI研究平台的74%,接近人類平均水平的92%。          儘管表現亮眼,Manus也引發了關於應用層AI初創公司實質上是否為“封裝器”的討論。批評者認為Manus只是將現有基礎模型與工具呼叫拼接起來。然而,這種觀點忽視了許多成功的AI產品(如Cursor、Windsurf、Harvey)也採用了類似模式,通過整合現有LLM、API和特定領域工具來創造價值。成功的封裝器通常通過直觀UI、專有評估、精細微調和精心設計的多智能體架構脫穎而出。Manus聯合創始人亦表示,他們選擇與模型開發正交的路徑,樂見新模型的發佈。          Manus的多智能體編排帶來了成本優勢(每任務約2美元,低於某些整合競爭對手),並提供了更高的透明度和使用者控制,允許使用者檢查、定製甚至替換子智能體和工具。其暴露檔案系統的特性讓使用者能直觀瞭解代理工作過程,預示了未來桌面AI應用的潛力。然而,其侷限性也存在,如任務複雜時跨代理協調難度增加,且其當前的優勢(使用者體驗、微調、整合)易被模仿。封裝器模式雖能快速部署和迭代,但也易受API定價或供應商政策變化的影響。最終,關鍵挑戰並非封裝器模式是否可行,而是如何為產品建立可持續的差異化,例如通過投資難以複製的專有評估、深度嵌入使用者工作流或整合獨特平台與資料集。歸根結底,AI領域的成功往往不取決於重新發明基礎模型,而在於誰能將現有模型有效整合,創造出使用者真正喜愛的產品。 (Web3天空之城)
估值暴增5倍!Manus母公司蝴蝶效應完成5.5億融資拓展AI應用
據媒體報導,Manus的母公司蝴蝶效應(Butterfly Effect)完成了一筆高達7500萬美元(折合人民幣約5.5億元)的新融資。此次融資由美國矽谷知名風投公司Benchmark領投,所籌資金將用於探索用AI智能體系統替代人類執行日常任務。融資完成後,蝴蝶效應投後估值增長約5倍,達到近5億美元(折合人民幣約36.4億元)。此前,Manus憑藉“全球首個通用AI Agent(智能體)”的名號引發廣泛關注。其打造的Agent能夠自主瀏覽網站,執行訂票、分析股票等任務,再加上高達5萬塊的內測邀請碼被熱炒,一度引爆全網。從蝴蝶效應的案例展示來看,Manus的突出賣點是“一鍵完成”。原本需要多個軟體協同完成的工作,使用Manus能迅速搞定。例如,當使用者輸入“幫我做一下介紹小米SU7十頁的PPT”,在未提供任何資料的情況下,Manus就能生成一份圖文並茂的PPT,還省去了排版和設計步驟。儘管Manus產品深受使用者追捧,但公司在滿足Agent服務需求方面面臨挑戰,受到伺服器容量和營運成本的限制。今年3月媒體消息顯示,Manus使用Anthropic的Claude AI模型和其他工具,平均每項任務要向Anthropic支付2美元。為解決相關問題,3月11日,Manus宣佈與阿里雲通義千問團隊達成戰略合作,雙方將基於通義千問開源模型,在國產算力平台實現Manus全功能落地。此外,公司還計畫利用這筆新融資將服務拓展到包括美國、日本和中東在內的其他市場。 (TechWeb)